V2EX  ›  英汉词典
Enqueued related words: Gold-standard

Penn Treebank

定义 Definition

Penn Treebank 指由美国宾夕法尼亚大学(University of Pennsylvania)主导构建的一套大型英语语料库(corpus),其中包含句子原文以及经过语言学标注的结构信息,尤其以词性标注(POS tagging)句法树/短语结构标注(parse trees)著名。它是自然语言处理(NLP)和计算语言学中最经典、最常用的基准数据资源之一。(也常被简称为 PTB。)

发音 Pronunciation (IPA)

/ˌpɛn ˈtriːˌbæŋk/

例句 Examples

The Penn Treebank is widely used to train parsers.
Penn Treebank 被广泛用于训练句法分析器。

Using Penn Treebank annotations, researchers can evaluate how well different models capture syntactic structure in real newswire text.
借助 Penn Treebank 的标注,研究者可以评估不同模型在真实新闻文本中捕捉句法结构的效果。

词源 Etymology

Penn 来自 “University of Pennsylvania(宾夕法尼亚大学)” 的常见简称;treebank 是计算语言学里的术语,表示“带有句法树标注的语料库”。其中 tree 指“句法树(parse tree)”,bank 有“储备、库”的含义,合起来就是“句法树语料库”。

相关词 Related Words

文学与著作中的出现 Notable Works

  • Mitchell P. Marcus, Beatrice Santorini, & Mary Ann Marcinkiewicz. “Building a Large Annotated Corpus of English: The Penn Treebank.” Computational Linguistics (1993).
  • Christopher D. Manning & Hinrich Schütze. Foundations of Statistical Natural Language Processing (1999).(讨论并使用 Penn Treebank 作为经典数据来源之一)
  • Daniel Jurafsky & James H. Martin. Speech and Language Processing(多版教材;在词性标注、句法分析等章节中频繁引用 Penn Treebank)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   874 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 17:53 · PVG 01:53 · LAX 09:53 · JFK 12:53
♥ Do have faith in what you're doing.